欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

python數據處理常用方法

1、讀取指定sheet和指定列的內容

data = pd.read_excel("data.xlsx",sheet_name="Sheet1",usecols=["year","code1","code2","name","keywords","type",'new'])

?

2、遍歷數據,對兩列數據相似度比較

for i in range(0,75065):
? ? if data.loc[i]['code2']!=0:
? ? ? ? if data.loc[i]['code1'][:5]==data.loc[i]['code2'][:5]:
? ? ? ? ? ? data.loc[i,'inter']=0
? ? ? ? elif data.loc[i]['code1'][:3]==data.loc[i]['code2'][:3]:
? ? ? ? ? ? data.loc[i,'inter']=1
? ? ? ? elif data.loc[i]['code1'][:1]==data.loc[i]['code2'][:1]:
? ? ? ? ? ? data.loc[i,'inter']=2
? ? ? ? else:
? ? ? ? ? ? data.loc[i,'inter']=3

3、遍歷數據,統計每類分類變量的數量

list= ['fund','year','inter','age','degree','title','institute','economy','gender','type']
for i in range(0,10):
? ? print(data[list[i]].value_counts())

4、遍歷數據,刪除某列為特定值的數據

df_clear = data.drop(data[data['discipline']=="H"].index)

5、正則去掉字符串左邊或者右邊的內容

import re
template = "DF','17340','http://www.zgglkx.com','2021','205')"

delete_left = template.lstrip('"DF')
print(delete_left)

delete_right = template.rstrip('205\')')
print(delete_right)

文章鏈接: http://www.qzkangyuan.com/19221.html

文章標題:python數據處理常用方法

文章版權:夢飛科技所發布的內容,部分為原創文章,轉載請注明來源,網絡轉載文章如有侵權請聯系我們!

聲明:本站所有文章,如無特殊說明或標注,均為本站原創發布。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。如若本站內容侵犯了原著者的合法權益,可聯系我們進行處理。

給TA打賞
共{{data.count}}人
人已打賞
建站教程

服務器用什么Linux系統好

2023-3-31 12:23:35

建站教程

python數據處理常用方法(二)

2023-4-3 13:07:37

0 條回復 A文章作者 M管理員
    暫無討論,說說你的看法吧
?
個人中心
購物車
優惠劵
今日簽到
有新私信 私信列表
搜索
主站蜘蛛池模板: 吴堡县| 大关县| 独山县| 东丽区| 汉沽区| 灵武市| 明光市| 舒城县| 中西区| 资阳市| 南城县| 沁源县| 海南省| 深水埗区| 印江| 肥西县| 密云县| 宜春市| 楚雄市| 五原县| 沁阳市| 雷州市| 灵台县| 乌鲁木齐县| 会宁县| 呼玛县| 禹州市| 黔江区| 清镇市| 科尔| 黄大仙区| 台北县| 水城县| 梁山县| 南雄市| 沽源县| 敖汉旗| 昌都县| 宁津县| 广宗县| 收藏|